أعلن نولان دالا في مدونته في 20 أبريل عن أول مباراة مخططة بين البوت كلوديكو وأربعة ممثلين للجنس البشري. لاحقًا تم حذف المنشور. في نفس اليوم، تم إنشاء موضوع على 2+2 (http://forumserver.twoplustwo.com/29/news-views-gossip/wcgrider-dong-kim-jason-les-bjorn-li-play-against-new-hu-bot-1526750/).

ظهرت معلومات تفصيلية بعد بضعة أيام على موقع جامعة كارنيجي ميلون. أصبح مشروع Brains Vs. AI امتدادًا لبرنامج الجامعة طويل الأجل للبحث في الذكاء الاصطناعي، والذي بدأ في عام 1956. في هذه الجامعة عمل هانز برلينر، بطل العالم في الشطرنج بالمراسلة 1965-1968، والذي اشتهر في السبعينيات والثمانينيات كواحد من رواد برمجة الشطرنج. البرنامج الذي أنشأه برلينر كمنتج ثانوي للعب الطاولة في عام 1979، هزم بطل العالم الحالي في مباراة لأول مرة في التاريخ. قام ثلاثة من طلاب برلينر الذين تخرجوا من جامعة كارنيجي ميلون بإنشاء الكمبيوتر Deep Blue، الذي ألحق الهزيمة بجاري كاسباروف في عام 1997. بدأ العمل على روبوت البوكر للعب تكساس هولدم غير محدود واحد ضد واحد منذ حوالي 11 عامًا.

جامعة كارنيجي ميلون
جامعة كارنيجي ميلون

شروط المباراة

– تجري اللعبة في كازينو Rivers في بيتسبرغ.

– على مدار أسبوعين من 24 أبريل إلى 7 مايو 2015، سيتم لعب 80,000 يد، 20,000 ضد كل من المحترفين الأربعة المدعوين.

– المنافسون: سيلعب البوت كلوديكو (Claudico – من اللاتينية «أعرج»، الإنجليزية: limp) مع دوجلاس «WCGRider» بولك، ودونج «Donger Kim» كيم، وبيورن «asianflushie» لي، وجيسون «cheet» ليس. اسم مستخدم الأخير على PokerStars غير واضح، من بين الإصدارات – megabanny، ForTheSwaRMm و JLlama.

– بغض النظر عن النتيجة، سيحصل اللاعبون على 100,000 دولار مقدمة من الرعاة – Microsoft Research و Rivers Casino.

– وقت اللعب – من الساعة 11 صباحًا حتى 8 مساءً مع فترات راحة بناءً على طلب اللاعبين.

– تعتبر توزيعات أوراق الجيب والأوراق المشتركة في كلتا المباراتين بين الإنسان والحاسوب «متطابقة»، لتقليل تأثير الصدفة. سيوجد اللاعبون الذين تكون مبارياتهم مع الآلة انعكاسًا لبعضهم البعض في طوابق مختلفة من الكازينو.

– يتم لعب جميع التوزيعات مع أعماق الستاكات في 200 نقطة عمياء كبيرة.

– سيتم عرض المباراة كاملة وبأوراق مكشوفة على قنوات Twitch.TV المناسبة:

كلوديكو – دوجلاس بولك #
كلوديكو – دونج كيم #
كلوديكو – بيورن لي #
كلوديكو – جيسون ليس #

وفقًا لمنشئ كلوديكو، البروفيسور توماس ساندهولم، فإن البوكر الآن في مركز اهتمام العلماء الذين يعملون على مشكلة الذكاء الاصطناعي، مثل الشطرنج من قبل. إنها لعبة معقدة للغاية بالنسبة للآلة، التي تضطر إلى اتخاذ القرارات في ظل معلومات غير كاملة ومتضاربة (الخداع، اللعب البطيء ...).

تم تدوين استراتيجية كلوديكو بواسطة الأستاذ وطلابه الجامعيين نوام براون وسام جانتسفريد. تم إجراء الحسابات على الكمبيوتر العملاق Blacklight في مركز الحوسبة الفائقة في بيتسبرغ.

يقول ساندهولم: «نحن نعمل على الخوارزمية في البوكر، لكن إمكانيات تطبيقها أوسع بكثير. - مكافحة الجرائم الإلكترونية والتجارة والطب ...»

قيم الأستاذ فرص نجاح الروبوت الخاص به بنسبة 50 على 50.

كان دوجلاس بولك أكثر تفاؤلاً بشأن قدرات العقل البشري: «آمل أن نتمكن من التحدث نيابة عن البشرية وهزيمة الكمبيوتر! أفهم أن أجهزة الكمبيوتر ستفوز على الناس في النهاية، لكننا سنحاول إطالة أمد هذه المواجهة، مثل كاسباروف في الشطرنج».

البروفيسور ساندهولم
البروفيسور ساندهولم

مناقشة على 2+2

timfbmx (مخضرم)
إذن، من نعتبره المرشح الأوفر حظًا؟

WowLucky (مخضرم)
يجب أن يكون الروبوت هو المستضعف.

Loctus (نفق الرسغي)
سيدمر WCG ودونج الروبوت.

Akimka (متمكن) (Zedmor)
من وافق على هذا؟ من الواضح أن WCG ليس لديه فرصة، لأن ميزته تعتمد على استغلال الأخطاء في استراتيجية الأشخاص، وفي هذه المباراة سيواجه تقاربه من توازن ناش شيئًا أكثر كمالاً. الفائز واضح.

what is check (قائد المئة)
من الواضح أنك لا تعرف عما تتحدث.

Akimka (متمكن)
من الواضح أنك لا تفهم نظرية الألعاب.

good2cu (بوه باه) (أندرو روبل)
تقترب روبوتات HU NL اليوم من التغلب على منتظمي NL100، ولكن ليس أفضل اللاعبين في العالم وجهًا لوجه.

سنرى ما سيتغير في غضون خمس سنوات :)

punter11235 (بوه باه)
يوجد في لعبة هولدم 1755 نوعًا استراتيجيًا مختلفًا من القلابات. أعتقد أنه في غضون 2-3 سنوات كحد أقصى، ستظهر برامج على أجهزة الكمبيوتر المحمولة لا تقهر بالنسبة لشخص عادي. لحسن الحظ، خارج لعبة الرأس، يختلف الوضع تمامًا، ولن يتم حل لعبة البوكر لعدة أشخاص لفترة طويلة (إذا تم حلها على الإطلاق)، لأنه لا يمكن تطبيق توازن ناش عليها – يكفي لاعب واحد يفعل أشياء غبية حتى يصبح اللعب بتوازن ناش أمرًا غير مربح للغاية بالنسبة لبعض اللاعبين الآخرين.

أعتقد أنه من الجيد بالنسبة لـ WCG أن يبقى في الذاكرة كرجل هزم جهاز كمبيوتر فائق في لعبة البوكر. في غضون عامين، عندما يتم سحقه بواسطة جهاز كمبيوتر محمول متوسط ​​المدى، لن يكون لهذه المباراة أي معنى على الإطلاق.

اليوم الأول

الجلسة الأولى:

الجلسة الثانية:

نتائج اليوم حسب رأي كلايتون نيومان:

أجاب الطالب الجامعي نوام براون في دردشة Twitch.TV على أسئلة المشاهدين (http://forumserver.twoplustwo.com/showpost.php?p=46762999&postcount=229):

– هل يأخذ كلوديكو في الاعتبار توقيتات المنافسين؟
– لا، لم نقم بإدخال هذه المعلمة حتى لا يقضي المحترفون ثلاث دقائق في كل توزيعة ... كما نفعل نحن.

– هل من الممكن تسريع اتخاذ القرارات على النهر؟
– يتطلب الحساب الكامل للاستراتيجية على النهر وقتًا – حوالي ثلاث دقائق ...

– هل سيغير كلوديكو طريقة اللعب في اليوم التالي؟
– هذا ما يجب توقعه ...

– هل أنت راضٍ عن النتائج المؤقتة؟
– أنا سعيد جدًا بكيفية سير المباراة. لدى كلوديكو نقاط ضعف واضحة، لكنه سيتحسن.

دوجلاس بولك:
– هذا الروبوت هو كانو الحقيقي بين الروبوتات: لا يلعب بشكل جيد للغاية، لكنه يحب الرفعات الغريبة.

اليوم الثاني

الجلسة الأولى:

بعد 10000 توزيعة، انخفض ربح فريق بولك إلى 85700 (+8.75 نقطة عمياء كبيرة/100)، ولم يتم العثور على النتيجة بعد 12000 توزيعة.

أجزاء من المباريات، تم وضع علامة عليها على 2+2

وضع الروبوت بنكين على النهر بـ Ks 6x ، اللوحة Ts 7s 5s 8x 8x ، جيد! لكن داغ كان لديه Qc 8c .

قام الكمبيوتر بعمل 3 مراهنات أكبر بسبع مرات من الرفع (21 نقطة عمياء كبيرة على رفع 3 نقاط عمياء كبيرة)!

المراهنة القياسية بـ 19 بنكًا ونصف:

قام بيورن لي للتو باستدعاء رهان كبير جدًا بـ 19 بنكًا على النهر بزوجين وعرض عليه ستريت: Ax 6x على اللوحة Ax 6x 7x 4x 9x ضد 8x 5x . في نفس الموقف، قام دونج أيضًا بدفع رهان كبير جدًا، وقام الكمبيوتر باستدعائه، لكن البنك كان أكبر قليلاً.

لدى WCG Kx Kx ، قام الروبوت بالعرج، وقام WCG بإعادة الرفع، وقام الروبوت بعمل 4 مراهنات، وفضل WCG الاستدعاء. القلاب Qx 9x x ، لعب WCG الشيك والرفع، وقام الروبوت باستدعائه. الدور 9x ، قاموا بالدخول في مواجهة شاملة، وعرض الروبوت Ax 9x .

على طاولة أخرى، قام cheet بالرفع بـ Ax 9x واستدعى إعادة الرفع. على القلاب Qx 9x x ، وضع الروبوت بنكين (4400 في البنك 2200)، وقام cheet بتمرير جيد.

مثال جيد على التباين في لعبة البوكر المكررة!

flushie لديه Ax Qx على النقطة العمياء الكبيرة، قام بعمل 3 مراهنات ووضع على القلاب Ax Qx x ببدلتين، ولعب فحص واستدعاء على الدور Tx ، وفحص على النهر Kx وبعد تفكير طويل استدعى رهانًا بنصف البنك. أظهر الروبوت Kx x مع بدلة.

استدعى Donger على طاولة أخرى 3 مراهنات، واستدعى مراهنات في البنك على القلاب والدور، وعلى النهر قام بالدفع بعد أن وضع الكمبيوتر 10٪ من البنك (1350 في البنك 13500؛ كان عليه إحضار حوالي 11000 للدفع). قام الروبوت بالطي.

توزيعة مكررة أخرى مثيرة للاهتمام.

WCG يرفع 300 ( Kd Ts )، الروبوت 2100، WCG يستدعي.

القلاب Kx 4d 2d ، شيك – شيك. الدور 7h . الروبوت 4200، WCG يستدعي. النهر Ac . الروبوت 13200، WCG يستدعي الدبابة ويخسر Ax Kx .

على طاولة أخرى: الروبوت – يرفع 250، جيسون ليس مع Ax Kx – إعادة الرفع 800، يستدعي.

القلاب Kx 4d 2d ، جيسون – 1200، يستدعي. الدور 7h . جيسون – 3000، الروبوت – يستدعي. النهر Ac – شيك – شيك، لدى الروبوت Kd Ts .

هل جن الروبوت؟ قام بالرفع 250 بـ Ax 3x ، واستدعى بولك بـ Qx Jx . على القلاب Kx Tx x (البنك 500) قام بولك بالدونك 100 واستدعى. الدور – Ax (البنك 700)، شيك – شيك. النهر x (البنك 700). بولك – شيك، الروبوت – 2/3 من البنك (469)، بولك، ضاحكًا، يتجاوز كل شيء 19181. ضغط الروبوت على الاستدعاء على الفور.

ما هذا بحق الجحيم؟ هذه المرة الثانية على الأقل التي يستدعي فيها الروبوت تجاوزًا كبيرًا جدًا لدفع الشيك على النهر بآس ضعيف!

(رد فعل فوري من أحد المطورين، سام جانتسفريد: «يجب أن يستدعي فقط في 7.8٪ من الحالات! مجرد حظ سيء ...»)

بالنظر إلى الأيام الأولى، يتكون التعديل من جانب الأشخاص مما يلي: الطي على الرهانات الكبيرة جدًا؛ خداع رخيص بدون مركز؛ المراهنة باستمرار على القلاب بشكل متكرر، دون القلق بشأن نطاق الفحص المضاد غير المتوازن على الدور.

معلومات محدثة حول المشروع – على موقع Rivers Casino (http://www.riverscasino.com/pittsburgh/BrainsVsAI/)